胶囊网络全新升级!引入自注意力机制的Efficient-CapsNet
论文链接:
https://arxiv.org/abs/2101.12491
论文代码:
https://github.com/EscVM/Efficient-CapsNet
Capsule介绍
深度学习之父 Hinton 针对卷积神经网络在特征提取的时候会忽略特征之间的关系的这个问题提出了 Capsule Network,卷积神经网络虽然能够通过卷积和池化能解决一定程度上平移不变性,旋转不变性以及放缩不变性,但是不能考虑到特征之间的相对位置关系。Capsule 是一个拥有多个神经元标量的组合体向量,它能够识别一个视觉实体,并输出关于该实体的方向,大小,物体与物体之间的相对位置关系等。
考虑如下场景,如果你是一名空军指挥官,要执行一次无人机的精准轰炸任务,其中一次轰炸大任务分为扫描任务,定位任务和轰炸任务三个子任务,为了能够让敌军城市瘫痪,最佳的选择轰炸目标就是电力供应中枢核电站,如下图标注所示,CNN 其实只能执行第一类无人机的扫描任务,判别该城市中是否有主要的目标核电站的存在,Capsule Network 则可以执行第二类无人机的定位任务,因为其输出的实例化参数中有核电站的相对位置信息。
为了能够能加清晰直观的阐述出 Capsule Network 动态路由算法的细节,根据如上算法框架做了如下两幅分别时动态路由迭代一次和动态路由迭代多次(3 次)的原理图。
▲图2.Capsule Network参数更新迭代一次原理图
该图片示由皮卡丘和其背景构成
皮卡丘整体是由脸颊和身体构成
身体则是由小短腿和躯干构成
脸部又有嘴和眼睛构成
皮卡丘的脸颊对该图像的仿射矩阵为 皮卡丘的身体对该图像的仿射矩阵为 皮卡丘的眼睛对该图像的仿射矩阵为 皮卡丘的嘴巴对该图像的仿射矩阵为 皮卡丘的腿部对该图像的仿射矩阵为 皮卡丘的躯干对该图像的仿射矩阵为
1.1.3 动态路由算法
Efficient-Capsnet
2.1 论文贡献
论文中提出的 Efficient-Capsnet 方法大大减少了可训练参数的数量。 论文中提出的 Efficient-Capsnet 方法在三个不同的数据集上获得最先进的结果。 引入了一种新颖的非迭代、高度并行的路由算法,该算法利用 Self-ATTENTION 来有效地路由数量减少的 Capsnet。
2.3 自注意力路由
Eifficent-Capsule 的输出层不再是个标量,而是个向量。每个 capsule 输出的向量不仅表示类的概率,也包含了各个属性的信息。其中目标函数为:
更多阅读
#投 稿 通 道#
让你的论文被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得或技术干货。我们的目的只有一个,让知识真正流动起来。
📝 来稿标准:
• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)
• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接
• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志
📬 投稿邮箱:
• 投稿邮箱:hr@paperweekly.site
• 所有文章配图,请单独在附件中发送
• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。